PdfMasher является инструментом для преобразования PDF-файлы, содержащие текст в готовых к книгу файлов HTML. PdfMasher спрашивает пользователя о роли каждой части текста, и делает это в эффективной манере. Ваш PDF имеет заголовок на каждой странице, и вы не хотите, чтобы мусор текст. Сортировать текстовые элементы по Y-позиции (таким образом, группируя их всех вместе), переложить выбрать элементы, и флаг их игнорировать. Они не появятся на вашем окончательном HTML. Если ваш PDF имеет сноски на многих страницах, сортировать элементы от содержания текста (при этом все элементы группировки с текстом, начиная с числа вместе) и флаг их как сноски. Они будут перемещены в конец документа, а PdfMasher попытается создать гиперссылки на сноски
Что нового В этом выпуске:.
Версия 0.7.4 удалил fairware диалог.
Комментарии не найдены